Day20 GAI爆炸時代 - LangChain Retriever介紹 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 20

生成式 AI

LLM 應用、開發框架、RAG優化及評估方法系列第 20 篇

Day20 GAI爆炸時代 - LangChain Retriever介紹

16th鐵人賽

yifan0802

2024-08-27 00:21:18

1407 瀏覽

分享至

不知不覺，已經來到第20天了!
前面已經了解LangChain基本語法與如何跟Vector DB串接起來
接下來要討論的就是如何去檢索到資料囉!
傳統上，Naive RAG的做法都是根據user query轉成embedding後，
進入到 Vector DB 後，去匹配出相關的top k個chunk，再連同user query一同餵給LLM來去生成出回答。

那我們現在要如何根據user query去找到存在vector DB中相關的chunk呢
就要透過我們LangChain框架中的retriever啦!

但在我們創建一個retriever前，我們必須要先知道這個東西是甚麼!

vector store

負責嵌入embedding和vector search，常作為retriever的骨幹，通常都是透過vector store去使用裡面的retriever，所以我們必須先設定好vector store。

程式碼範例

vector_store = MongoDBAtlasVectorSearch(
    collection=collection,
    embedding=aoai_embeddings,
    index_name=vector_search_index,
    text_key="content" #這裡需要指定document文字的key。經過similarity找到相似的document後，會返回這個key的值
)

注意: